快科技5月6日消息,NVIDIA宣布旗下开源大模型Nemotron 3 Super登上EnterpriseOps-Gym排行榜开源类别首位,以平均27.3分的成绩击败Kimi-K2.5、DeepSeek v3.2、MiniMax m2.7及GPT-OSS-120B等众多竞争对手。

具体排名显示,Kimi-K2.5以26.2分位列第二,DeepSeek v3.2以23.8分排在第三,MiniMax m2.7以23.0分紧随其后,GPT-OSS-120B以17.1分位列第五。


Nemotron 3 Super是NVIDIA在今年3月GTC大会上发布的混合专家模型,总参数量达到1200亿,但每次推理仅激活其中120亿参数,在保持模型知识密度的同时大幅降低推理开销。

该模型采用了多项关键技术。潜在混合专家架构通过压缩输入数据,能够在相同推理成本下激活并调用多达四倍数量的"专家子网络"(专业化的神经网络模块)来处理任务。

Nemotron 3 Super还原生支持100万token上下文窗口,在长时间任务中可保持长期记忆,有效避免目标偏移问题。其吞吐量较上一代Nemotron Super提升超过五倍。

在硬件适配方面,该模型针对NVIDIA Blackwell架构进行原生NVFP4预训练,在B200上的推理速度比H100使用FP8格式快四倍,同时保持模型精度。

此外,借助NVIDIA NeMo Gym与NeMo RL框架,该模型在21种环境配置下完成了多环境强化学习后训练,总计部署了超过120万次训练环境。

NVIDIA Nemotron 3系列开源模型覆盖Nano、Super和Ultra三条产品线。NVIDIA还同步推出了Nemotron 3 Nano Omni,宣称可将AI吞吐量提升九倍。